AI资讯新闻榜单内容搜索-Language M

ECCV 2024 | 提升GPT-4V、Gemini检测任务性能，你需要这种提示范式

多模态大模型（Multimodal Large Language Models，MLLMs）在不同的任务中表现出了令人印象深刻的能力，尽管如此，这些模型在检测任务中的潜力仍被低估。

来自主题: AI技术研报

10841 点击 2024-07-22 14:58

开源视频版GPT-4o？快速记忆，实时问答，拿下CVPR'24长视频问答竞赛冠军

基于 ChatGPT、LLAMA、Vicuna [1, 2, 3] 等大语言模型（Large Language Models，LLMs）的强大理解、生成和推理能力

来自主题: AI技术研报

10553 点击 2024-07-07 16:35

ACL 2024论文盖棺定论：大语言模型≠世界模拟器，Yann LeCun：太对了

最近两天，一篇入选 ACL 2024 的论文《Can Language Models Serve as Text-Based World Simulators?》在社交媒体 X 上引发了热议，就连图灵奖得主 Yann LeCun 也参与了进来。

来自主题: AI技术研报

9380 点击 2024-06-16 18:07

「连续数值分布式表征」加持，浙大UIUC让语言模型擅长表格预测 | ICLR 2024 Spotlight

来自浙江大学和伊利诺伊大学厄巴纳-香槟分校的研究者发表了他们关于「表格语言模型」（Tabular Language Model）的研究成果

来自主题: AI技术研报

9099 点击 2024-06-15 16:23

万字综述大模型高效推理：无问芯穹与清华、上交最新联合研究全面解析大模型推理优化

近年来，大语言模型（Large Language Models, LLMs）受到学术界和工业界的广泛关注，得益于其在各种语言生成任务上的出色表现，大语言模型推动了各种人工智能应用（例如ChatGPT、Copilot等）的发展。然而，大语言模型的落地应用受到其较大的推理开销的限制，对部署资源、用户体验、经济成本都带来了巨大挑战。

来自主题: AI技术研报

10145 点击 2024-06-14 10:35

AI信任危机之后，揭秘预训练如何塑造机器的「可信灵魂」

在人工智能的前沿领域，大语言模型（Large Language Models，LLMs）由于其强大的能力正吸引着全球研究者的目光。在 LLMs 的研发流程中，预训练阶段占据着举足轻重的地位，它不仅消耗了大量的计算资源，还蕴含着许多尚未揭示的秘密。

来自主题: AI技术研报

7761 点击 2024-04-25 17:22

浙江大学 ReLER 实验室研究员杨宗鑫：哆啦A梦的百宝袋 | Agent Insights

《DoraemonGPT: Toward Understanding Dynamic Scenes with Large Language Models》

来自主题: AI技术研报

10437 点击 2024-04-20 12:07

去年爆火的大模型综述，如今出书了（免费获取见文末）

相信很多朋友都看过这篇论文，在 2023 年 3 月，一支来自加拿大滑铁卢大学、清华大学和新加坡管理大学的团队，发表了一篇大模型综述《A Survey of Large Language Models》.

来自主题: AI资讯

7804 点击 2024-04-20 10:31

如何从头开始编写LoRA代码，这有一份教程

作者表示：在各种有效的 LLM 微调方法中，LoRA 仍然是他的首选。LoRA（Low-Rank Adaptation）作为一种用于微调 LLM（大语言模型）的流行技术，最初由来自微软的研究人员在论文《 LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 》中提出。

来自主题: AI技术研报

7213 点击 2024-03-20 16:16

一句指令自动玩手机，网上冲浪神器Mobile-Agent来了

随着多模态大语言模型（Multimodal Large Language Model，MLLM）的快速发展，以 MLLM 为基础的多模态 agent 逐渐应用于各种实际应用场景中，这使得借助多模态 agent 实现手机操作助手成为了可能。

来自主题: AI资讯

8229 点击 2024-02-04 13:39